查看原文
其他

NGS十年发展史,看这篇就够了 | Nature综述解读(上)

2016-06-23 徐晓玲 华大科技BGITech

日前Nature Reviews Genetics 刊出了一篇综述,盘点近十年来测序技术的发展。从最初的“高山仰止”到如今走进寻常百姓家,正是测序公司和科研人员们孜孜不倦的努力,推动了行业不断向前发展,而其中的佼佼者,也在特定的历史时期留下了属于自己的印记。


科技君在此分(上)(下)两篇为大家解读该综述,欢迎各位看官批评指正!PS.科技君实在掩饰不住自己的骄傲和激动,因为华大基因自助研发的BGISEQ-500也在其中!


本文约2800字,阅读需6分钟。如需转载请后台联系取得授权。


自2003年人类基因组计划完成之后,测序技术发展迅猛,多种测序原理产品在市场上出现,接受市场的检验。测序读长不断加长、通量不断提升、时间不断缩短,促进测序成本快速下降,大量基因组序列被破译,测序物种数量和物种多样性与日俱增。



图1. 测序技术发展简史


“基因科技造福人类。”从时间的纵轴上看,NGS测序仪的出现具有非凡意义,测序技术的发展自此势如破竹、高歌猛进。最初个人全基因组测序费用高达令人咋舌的1亿美金,发展到2008年,一个100Gb数据量的人基因组只需几十万美金,降幅达99%。到今天,一个100Gb数据量的人基因组只需要1000美金左右,仅相当于1亿美金的五万分之一!



图2. 2001-2016年人基因组完成费用变化

 

风云十余载,都有哪些公司和测序系统在时代中留下了专属自己的印记呢?


一、NGS技术发展史


在测序技术发展初期,就像是春秋战国时期的百家争鸣,各种idea都会受热捧,大家都很有热情去尝试新技术。比较有代表性的是以下几种:


1



▌公司:454
▌系统:Genome Sequencer 20 System
▌时间:2005年


第一台NGS测序仪是在2005年出现的,454公司推出第一个基于焦磷酸测序原理的高通量基因组测序系统——Genome Sequencer 20 System,这是核酸测序技术发展史上里程碑式的事件。随后,罗氏公司以1.55亿美元收购了454公司,并在2006年推出了更新的GS FLX测序系统。


随着其他测序技术的出现,454技术读长长(最长可以到1000bp),且准确度高,在二代测序中属于佼佼者,却因其成本较高,市场接受度不高,导致2013年罗氏公司表示,它将在未来3年内关闭454生命科学测序业务,并裁掉约100名员工。今年年中其位于美国康涅狄格州布兰福德的454工厂也将最终关闭。


2



▌公司:Solexa
▌系统:Genome Analyzer(简称GA)
▌时间:2006年


2006年,Solexa公司也推出了自己的NGS系统——Genome Analyzer,简称GA。这套基于DNA簇(DNA cluster)、桥式PCR(Bridge PCR)和可逆阻断(Reversible terminator)等核心技术的系统具有高通量、低错误率、低成本、应用范围广等优点。2007年,Illumina公司以6亿美元的高价收购了Solexa,使GA得以商品化。


GA最早期的版本一次运行可获得1Gb的数据,因此也有1Gb Analyzer的含义,而最新的HiSeqX10平台则能够在3天的运行中获得16Tb以上的数据,读取的碱基长度达到150bp。


3



▌公司:美国应用生物系统公司(ABI)
▌系统:SOLiD
▌时间:2007年


在上述两家公司之前,测序市场的垄断地位一直由美国应用生物系统公司(ABI)牢牢掌控。自公司的共同创始人Leroy Hood在上世纪80年代中期设计了第一台自动荧光测序仪之后,生命科学研究就摆脱了手工测序的繁琐和辛劳,骄傲地迈入自动测序的新时代。


但是,2005年454推出了FLX焦磷酸测序平台,ABI的领先地位被撼动,于是,后者迅速收购了一家测序公司——Agencourt Personal Genomics,并在2007年底推出了SOLiD 新一代测序平台。从SOLiD到SOLiD 3,短短一年多时间,它已经上演了一出精彩的“一级方程式赛车”。到SOLiD 5平台的测序通量已达到30Gb/天,成本低于60美元/Gb,准确率高达99.99%。并且由于SOLiD系统采用的不是PCR反应进行DNA合成与测序,因此对于高GC含量的样本,SOLiD系统具有非常大的优势。


可以说,测序市场在2010年前后形成了454、Solexa和SOLiD三足鼎立的局面。但是后续SOLiD系统通量难以提升,且读长短、成本高,现已退出了历史舞台。


4



▌公司:华大基因
▌系统:BGISEQ-500
▌时间:2015


后续还出现了Complete Genomics公司的Black Bird测序仪、Life Technologies 公司的Ion Proton(如今被Thermo Fisher收购)系列测序仪等,不过都由于自身的短板导致市场份额逐渐缩小。


直至2013年3月18日,华大基因宣布以1.176亿美元完成对美国纳斯达克上市公司Complete Genomics的全额收购。历经两年的技术改进和研发,在第十届国际基因组学大会(ICG-10)上,华大基因正式发布了自主研发的新型桌面化测序系统BGISEQ-500。


BGISEQ-500具备精准、简易、快速、灵活、经济等特点,单项应用最快可在24小时内完成,针对个人基因组检测精度可达99.99%,充分满足科研和临床领域的不同测序需求,在测序准确度、一致性等关键指标上达到甚至超过成熟商业测序系统。


在研发过程中,华大基因不断突破技术壁垒,持续获得关键技术和核心应用的自主知识产权,包括DNA纳米球文库构建技术、Pattern Array模版阵列技术、cPAS测序技术等一系列全球顶尖的测序原理和配套软硬件,为BGISEQ-500提供最出色的测序性能和最坚实的技术支持。基于BGISEQ-500的应用也已经逐步推出,首个面世的RNA-Seq产品因其优异的准确性、重复性和一致性,获得科研用户的一致好评和热忱推荐。


为了解决大多数科研用户日益增长的测序需求与现有的测序瓶颈之间的矛盾,华大基因基于BGISEQ-500提出了测序应用整体解决方案BGISEQ-500n。其针对不同的测序应用需求,通过对n台BGISEQ-500的优化配置,构建灵活的大、中、小型测序平台,力求为广大科研工作者提供最高效、最便捷的一体化测序解决方案。BGISEQ-500n不仅具备BGISEQ-500的样品处理、样品检测、测序结果分析等一系列软硬件工具,还将整合包括实验室构建、平台运行测试、样本数据库构建、数据分析、人员培训等一系列标准化的配套应用模板。此外,BGISEQ-500n还将提供强大的多组学测序网络,并连通生物信息分析云平台BGI Online,提供灵活的存储和计算解决方案,支持流畅的异地化部署。


图3-6. 2016年5月27日,华大基因在初夏发布会上发布了测序应用整体解决方案BGISEQ-500n,这是全球测序技术领域首次大批量列装“中国造”,是为“大国重器”,标志着中国在高端测序技术的源头创新和上下游协同发展上迎来新的突破及引领。




二、NGS原理特点(短读长测序)



5


模板扩增

模板需要放大信号,即我们通常说的建库,需要把待测序的核酸扩增,如下图所示,NGS技术模板扩增主要有以下四种策略:


1.乳液PCR【454(Roche),SOLiD(Thermo Fisher),GeneReader(Qiagen),Ion Torrent(Thermo Fisher)

在乳液PCR,片段DNA模板与dNTP、引物和DNA聚合酶包在一个油滴中。在凝胶中进行PCR扩增,最后得到成千上万份相同的DNA序列。


2.固相桥式扩增【Illumina

片段DNA分散到Flowcell上,与固定的引物结合,进行桥式扩增,从而形成很多DNA簇。


3.固相的模板移位【SOLiD Wildfire(Thermo Fisher)

片段DNA与固定的引物结合,PCR扩增延长引物得到第二天链。然后部分变性,使得自由端可以与邻近的引物结合,再次扩增,起到放大的效果。


4.DNA纳米球【Complete Genomics】

片段DNA加两次接头,然后进行滚环扩增,形成一个DNA纳米球,最后纳米球通过杂交的原理固定在阵列的flow cell。



图7. 二代测序建库原理


6


测序原理

1.基于连接的测序原理(SBL)——SOLiD & Complete Genomics


简单说,SBL测序就是用1-2个已知碱基标记的探针与目标DNA杂交,然后再与下一个标记的探针连接,检测标记探针的信号,从而知道目标DNA的序列信息。


SOLiD的全称是Sequencing by Oligo Ligation Detection,即寡聚物连接检测测序,其基本原理是通过荧光标记的8碱基单链DNA探针与模板配对连接,发出不同的荧光信号,从而读取目标序列的碱基排列顺序。


CG的测序原理叫组合探针锚定连接(cPAL),利用四种不同颜色标记的探针去读取接头附近的碱基,探针能够与DNA片段结合,T4  DNA连接酶连接探针和anchor,使探针稳定结合,从该探针携带的荧光基团的颜色为判断出该位置是何种碱基。当一轮反应结束后,去除anchor-prob产物,重复上一轮步骤测序下一个碱基。



图8. 基于连接的测序原理


2.基于合成的测序(SBS)


SBS这个术语是用来描述依赖DNA聚合酶来测序的方法,但是SBS方法又可以分为循环可逆终止(CRT)和单碱基添加(SNA)。


虽然Qiagen公司的GeneReader也是采用CRT的测序原理,但我们熟知的还是Illumina的CRT测序原理。四种dNTP被不同的荧光标记,每个循环就结合一个互补的碱基,拍四次照,四个照片重合,出现哪种荧光标记就可以确定是哪个碱基。反应之后荧光基团会被切除,这样就露出了3’羟基基团(-OH),可以与下一个碱基连接。



图9. 合成测序原理:CRT


另一种SBS测序方法叫单碱基添加(SNA),454焦磷酸测序和Ion Torrent都属于这种测序原理。SNA的方法依赖单个信号来标记每个测序的碱基。因为它不能终止反应,所以每次只能允许进一种碱基来防止继续延长。这样要是单碱基重复就会继续读取。


454是第一台NGS测序仪,它的SNA系统是含有特定引物的珠子连同酶混合物一起进入PicoTiterPlate,当有一个碱基连入DNA链,就会产生一个生物荧光信号,通过相机捕获。


Ion Torrent是第一台不用光学传感的测序仪。它是通过测序过程中产生的氢离子,使用CMOS-ISFET检测器来检测PH值来识别不同碱基。所以要是有连续碱基重复的情况下,准确度不高。



图10. 合成测序原理:SNA


欢乐时光过得特别快,又到时间讲Byebye!今天的Nature综述解读(上)篇暂时到这里,明天我们将推出综述解读(下)篇,没看够的小伙伴记得提前搬好小板凳,不见不散哟!



联系我们

华大基因科技服务提供全方位一站式的科研服务,从基因组、转录组、表观调控、蛋白质组都有全套成熟的产品。鉴于新平台的搭建,2016年新推出了BGISEQ-500 RNA-seq、BGISEQ-500 外显子测序。

如需了解更多产品信息,欢迎访问华大基因科技服务官网(http://www.bgitechsolutions.com),或咨询当地科技服务代表!


参考文献:

Sara Goodwin, John D. McPherson, W. Richard McCombie. Coming of age: ten years of next-generation sequencing technologies. Nature,17 (2016),333-351 


撰稿:徐晓玲

编辑:市场部



猜你喜欢:

测序跨入百元人民币时代!小伙伴们都惊呆了~

再多欧元也难买的一次“机”遇!




请继续关注“BGI华大科技”公众号,

科技君将一如既往地为你提供精彩内容!

关注华大科技,尽享精彩科研!

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存